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摘要 . 趋势 跟踪 交易 已 经 在 量化 金融 领域 中 得 到 了 广泛 应 用 。 它 能 抓 住 市 场 的 重 
要 单 边 趋势 从 而 获得 收益 ， 但 在 震荡 行情 中 仍 存在 连续 亏损 的 问题 。 为 进一步 提 
高 策略 的 绩效 ， 通 过 参考 止 价 止 损 机 制 对 期 货 价格 制作 涨 跌 标签 ， 以 K 线 数据 、 
技术 指标 和 时 间 序 列 特征 构建 特征 组 并 使 用 长 短期 记忆 神经 网 络 进行 特征 提取 ， 
使 用 6 种 不 同 的 机 器 学 习 分 类 器 构建 交易 方向 过 滤器 ， 使 用 螺纹 钢 连续 合约 数据 
为 样本 ， 把 分 类 器 预测 的 涨 跌 方向 作为 过 滤 条 件 爱 加 到 趋势 跟踪 策略 的 开 仓 
件 之 中 ， 对 交易 信号 进行 筛选 。 实 证 发 现 ， 构 建 的 过 滤器 均 对 策略 绩效 有 提 

， 其 中 由 XGBoost 分 类 器 构建 的 过 滤器 使 策略 的 年 化 收益 率 由 6.39% 提 高 到 
15.68%; 此 外 ， 通 过 黄金 期 货 与 豆粕 期 货 的 实验 证 明了 基于 机 器 学 习 模型 预测 的 
涨 跌 趋 势 作 为 交易 方向 过 滤器 ， 可 提高 趋势 跟踪 策略 的 绩效 。 
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Abstract. Trend following strategies have a wide-ranging role in quantitative trading 
fields, which can capture important unilateral market trends for large gains, while this is 
vulnerable to losses in the period of consolidation. In this paper, we explored the trend 
trading System in the Chinese futures market based on machine learning techniques and 
statistical methods. This research utilized the Long-Short-Term Memory network to ex- 
tract features of time series then predicted the price movements by Machine Learning 
classifiers. Moreover, based on rebar futures data, the results reveal that the annualized 
Teturn improved from 6.399% to 15.68% after the trading signals generated in the trading 
Strategy were filtered using the XGBoost model. Also, futures on gold and Soybean were 
used to further test the integrated strategy and the results of the experiment Show the 


effectiveness of the model in filtering false trading Signals. 
玫 eywords. Machine Learning，LSTM，Time Series Forecasting，Trend Following 


Strategies, Deep Learning 
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机 科学 技术 与 量化 


人 们 整合 股票 市 场 中 的 技术 分 析 和 数据 控 ] 
资 组 合 [1]。 诸 如 人 工 神 经 网 络 [2]， 蜂 群 智 能 [3] 和 进化 算法 [4 等 技术 
各 种 方式 应 用 于 金融 市 场 中 。 在 资本 市 场 上 ， 股 票 、 


篷 全 


交易 新 相 结合 的 新 领域 得 到 了 良好 的 发 展 ， 


本 


走 的 数学 状态 。 利 益 相 关 者 试图 


融 投 资产 品 的 价格 波动 总 是 不 确 


; 侈 


险 的 同时 获得 更 高 的 投 


资 组 合 收益 。 


构建 可 靠 的 预测 模型 ， 
而 市 场 中 是 否 


大 口 


胃 与 人 工 智能 来 建立 有 利 可 


(化 
商品 期 货 


定 的 。 它 是 一 种 含有 自然 噪声 的 


存在 可 预测 性 是 定量 分 析 


名 


的 投 
已 经 以 
1 对冲 基 金 
随机 行 
以 便 在 降低 投资 风 


领域 的 投资 者 所 感 兴趣 的 。 例 如 ， 预 测 股票 价 格 未 来 走势 和 优化 投资 策略 的 


其 中 一 种 方法 是 将 经 典 的 交易 策略 〈 如 海龟 交易 法 ) 和 机 器 学 习 (Machine 
learning，ML ) 算法 结合 起 来 [5]。 

许多 学 者 对 基于 机 器 学 习 辅 助 的 量化 投资 方向 进行 了 研究 并 提出 了 许 
多 新 的 方法 。 张 剑 华 和 王波 [6] 针 对 沪 深 300 股 指 构建 了 一 个 基于 支持 向 量 机 
CSVM) 的 量化 交易 系统 用 于 预测 其 涨 跌 趋 势 并 把 其 转化 为 交易 信号 。 在 回 
测 结果 中 显示 ， 该 交易 系统 在 和 蛋 亏 比方 面 表现 较 好 ， 模 型 在 暴涨 暴跌 中 能 


够 稳定 地 鼻 利 。 另 外 ，Vats 和 Samdani[7] 将 字 


申 经 


了 > 
聚 类 


习 、 随 机 森林 法 和 K-Means 


技术 应 用 于 股票 


和 非 聚 类 技术 都 能 


企 预 测 性 能 方面 有 良好 的 表现 。 


明 


计算 速度 和 效率 ， 并 证 


网 络 、 支 持 扩 
市 场 预测 。 他 们 证 明了 聚 
论文 还 总 结 了 每 个 模型 的 
了 机 器 学 习 在 实时 应 用 于 股票 交易 是 可 行 的。 除了 


三 
是 


机 、 多 核 学 


类 


机 器 学 习 有 许多 金融 方 
交易 的 机 制 当 中 。 龙 奥 


月 


works，RNN) 。 对 四 种 交易 策 


取得 较 好 的 收益 。 


列 的 一 个 重要 概率 模型 ， 同 时 ， 它 也 是 一 个 黑箱 模型 ， 
货 市 场 的 隐藏 状态 。 然 而 ， 它 的 缺点 是 投资 者 不 能 直接 知 
因此 ， 能 够 预测 交易 方向 的 M-P (MecCulloch-Pitts) 神 
结果 表明 ， 在 A 股 市 场 上 使 用 基 了 
以 将 基准 收益 率 提高 31.11%[9]。 上述 


期 
入 状态 还 是 志 出 状态 。 
经 元 模型 比 前 者 更 有 优势 。 实 证 
模型 的 量化 策略 可 


看 的 实际 应 


人 | 
短期 记忆 网 络 (LSTM) 的 方法 对 黑色 金属 期 货 〈 包 括 焦 
钢 ) 的 价差 趋势 进行 预测 。 实 证 分 析 表 明 
优 于 BP 〈BackPropagation ) 神经 网 络 和 有 


略 的 比较 显示 ，LSTM 神 经 网 络 在 回 
另 一 方面 ， 隐 马尔 科 夫 模型 是 机 器 学 习 算法 中 关于 时 间 序 


j 之 外 ， 深 度 学 习 技术 也 被 用 于 下 
等 [8] 提 出 在 时 间 序 列 分 析 中 使 用 协 整 检验 和 基于 长 


究 套利 


痰 、 铁 矿石 和 螺纹 


，LSTM 在 时 间 序 列 预测 性 能 方面 
盾 环 神经 网 络 〈Recurrent Neural Net- 


测 期 普遍 


可 以 应 用 于 预测 商品 


道 当前 状态 是 买 


进 


学 习 或 深度 学 习 对 传统 的 量化 交易 策略 进行 优化 ， 让 交易 系统 在 


有 具 竞 争 力 。 


M-P 神 经 元 
是 通过 机 器 


金融 市 场 上 


究 主要 


去 入 


趋势 跟踪 策略 是 传统 量化 


易 的 重要 组 成 部 分 ， 它 


是 基于 技术 指标 为 短 
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期 交易 设计 的 动态 通道 策略 [10]。 在 动荡 的 期 货 市 场 上 ， 基 了 
些 局 限 性 [11]。 例 如 ， 作 为 趋势 跟踪 策略 的 基 而 


易 策 略 的 表现 却 有 


六 技术 指标 的 交 
1 指标 ， 移 


动 平均 线 会 出 现 误导 性 的 穿越 信号 ， 而 唐 奇 安 通 道 也 存在 同样 的 问题 。 被 称 


为 "趋势 跟踪 之 


父 ”的 理 查 德 ... 


唐 奇 安 


发 了 唐 奇 安 通道 
该 策略 是 经 典 的 趋势 交易 ， 是 一 个 
成 ， 上 线 ， 下 线 和 被 前 


向 。 


条 移动 平均 线 组 
别 一 些 价 格 突破 ， 从 而 产 引 
到 趋势 ， 市 场 波动 的 高 点 和 低 点 ， 支 撑 和 阻力 水 平 ， 
破 口 [14]。 此 外 ，Swart[15] 在 对 南非 期 货 
通道 的 趋势 跟踪 交易 策略 进行 投资 组 合 优化 。 在 实话 


上 交易 


简单 而 通 ) 


j 的 技术 指标 。 
两 者 围绕 的 中 线 。 它 的 交易 模式 是 识 
言 号 。 不 仅 如 此 ， 这 样 的 价格 通道 可 以 检测 


(Richard Donchian ) 在 20 世 纪 中 期 开 
指标 ， 以 帮助 交易 者 识别 价格 运动 是 否 可 能 持续 或 逆转 其 方 


一 wy 


市 场 波动 以 及 


它 通 币 由 三 


要 的 突 


场 的 研究 中 ， 使 用 了 基于 唐 奇 安 
F 中 发 现 ， 该 策略 在 大 多 


数 情况 下 可 以 产生 高 收益 ， 但 在 长 期 投资 中 缺乏 良好 的 稳定 收益 ， 在 面 对 市 


场 风 险 时 表现 日 


并 不 总 是 适用 。 


在 高 价位 买 入 ， 
是 普 
产 


H 较 差 的 容 恕 度 。 


根据 以 往 文献 中 指出 的 问题 ， 


例如 ， 当 通道 之 间 的 宽度 很 窗 
频繁 的 通道 价格 突破 将 有 可 能 导致 系统 连续 


就 很 难 捕捉 到 期 货 的 价格 趋势 。 
在 低 价位 卖 出 ， 从 而 导致 连续 亏损 和 高 额 的 交易 成 本 。 这 就 
遍 存在 的 通道 的 虚假 突破 的 问题 。 因 出 


》 


Trading too frequently in a short 
period of time during market 
consolidation 


5， 唐 奇 安 通道 丰 
生 虚 假 的 交易 信号 是 其 收益 不 佳 的 原因 之 一 。 


本 文 提出 了 如 图 1 中 所 示 的 动机 案例 。 尽 
管 唐 奇 安 通 道 可 以 识别 一 些 交 易 机 会 ， 但 在 错综复杂 的 期 货 市 场 中 ， 
并 且 存 在 短期 的 市 场 冲 击 时 ， 


该 策略 


Consecu 


| 
mm LOWEer band 
mm Sell signal 
ee BUY Signal 
ooeeeeeeeee 一 睛 哺 户 线 上 号 卢 上 上 上 上 书 
产 产 闽 六 网 轴 其 人 多 次 日 G 虽 日 日 唱 日 日 呈 虽 虽 关 并 并 几 闪 并 并 呈 NNN 
男 口 四 口 轩 口 团 口 邹 口外 下 忆 只 呈 六 六 四 四 六 人 轴 贡 所 马 靖 呈 六 六 四 办 六 六 印加 全 本 和 二 
局 可口 印 口 四 口 加 口罩 口 四 己 加 口中 口 加 口上 四 口罩 口 四 所 吕 品 


图 1. 动机 案例 


E 反 转 和 震荡 期 间 


High trading cost! 


tive losses! 


为 了 解决 上 述 趋势 跟踪 交易 系统 的 缺陷 ， 我 们 使 用 机 器 学 习 技术 来 探索 


价格 序列 的 变化 规律 。 根 据 过 去 的 价格 轨迹 ， 利 ) 


分 析 对 期 货 价格 的 上 涨 和 下 跌 进 行 分 类 和 预测 。 此 外 ， 基 于 LSTM 的 方法 从 


技术 分 析 和 人 金融 时 间 序 列 
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选 定 
习 分 类 器 的 学 习 特 征 。 同 
预测 的 收盘 价格 变动 方向 
示 着 投资 者 做 出 相应 的 买 
时 效 性 问题 ， 也 就 是 
尤其 十 


类 


在 价格 盘整 中 ， 


的 技术 指标 和 交易 数据 


Ph 提取 特 生 
趋 


由 上 山 


F[16]， 


时 ， 


上 产 台 
势 交易 策略 也 会 产生 交易 信号 ， 这 与 分 类 器 


的 输出 被 用 作 机 器 学 


进行 比较 ， 如 果 两 者 产生 相同 的 方向 ， 


虽然 这 样 


入 或 卖 出 动作 。 


那么 就 会 指 
的 组 合 信号 可 能 有 潜在 的 


等 待 技术 指标 和 预测 器 指向 同一 方向 ， 但 如 


组 合 信号 是 相当 可 靠 的 。 总 的 来 说 ， 


和 候 
主要 概念 ， 


踪 交 易 系 统 ， 探 索 计 旬 


FLSTM 提 取 的 4 
在 量化 交易 中 的 应 用 。 


异 佣 
经 网 络 的 信息 可 传递 性 ， 


学 习 预 测 器 的 性 能 ， 也 误 


系统 具有 更 强 的 可 预 讽 


| 性 。 


|- 字 


将 这 一 技术 应 用 于 特征 


F 提 


桂 行 


是 取 的 环节 中 ， 


E 长 期 投资 中 9 
这 是 我 们 提出 的 


用 以 过 滤 虚 假 交 易 信 号 ， 提 高 系统 的 整体 性 能 
综 上 所 示 ， 本 文 将 通过 使 用 基 卫 
智能 


E 和 机 器 学 习 的 趋势 跟 
首先 ， 尝 试 利用 LSTM 神 
以 增进 机 器 


相 结 


次 ， 通 过 这 样 


利 收 巷 ， 
风险 能 


它 可 以 保持 稳定 


2. 相关 工作 
期 货 作 为 一 种 金融 衍生 品 


同 发 展 而 来 的 标准 化 合同 。 远 期 合同 是 与 某 人 签订 的 的 购买 远 期 商品 
纲 定 的 时 间 后 以 特定 的 价 
间 后 以 特定 的 价格 交付 资产 。 
企 未 来 交易 日 


是 以 对 冲 为 目的 的 协议 。 
收 资产 ， 卖 方 同 意 在 一 段 
未 来 交易 的 价格 被 称 为 期 


的 收益 来 应 对 股票 下 


对 冲 现 货 j 


要 用 了 


人 


和 场 带 来 的 风险 ， 是 由 


是 机 器 学 习 和 深度 学 习 的 引入 可 以 使 技术 指标 交易 
合 的 交易 系统 ， 计 
能 技术 与 技术 分 析 相 结合 的 可 交易 性 质 ， 可 以 解决 传统 趋势 交易 中 普遍 存在 
的 虚假 信号 问题 。 从 而 本 文 提 出 的 交易 信号 过 滤 方 法 可 以 提 
生 场 的 震荡 期 ， 


FE 实 人 工 智 


高 投资 
并 提 


组 合 的 熏 
高 策略 的 抗 


远 期 合 


的 合同 ， 


具体 地 ， 买 方 同意 在 3 


格 接 


时 


那么 双方 同意 用 了 


货 价 格 ， 而 双方 必须 


或 交割 
据 ， 每 种 商品 的 性 
年 后 。 到 期 后 ， 标 的 物 的 
乘 以 合同 的 数量 就 是 各 自 
文 使 用 的 是 主力 连续 合 
力 合约 是 是 市 场 上 最 活跃 、 
货 为 例 ， 根 据 上 海 期 货 交 


J 册 
和 10 月 的 螺纹 钢 合约 的 期 


口 
吕 口 


。 这 样 的 标的 物 可 以 是 茶 
E 质 ， 期 货 的 交割 日 


的 指定 日 期 称 为 结 


、 农 产品 )， 村 


商品 《如 志 


化 1 人 人 
饥 货 


忆 


的 熏 亏 。 在 本 次 的 研究 中 ， 
约 ， 也 就 是 连续 的 、 


流动 性 


期 可 以 是 一 周 
价格 便 生成 了 ， 而 期 货 价 和 现货 价 之 间 的 差额 


、 原 ; 


后 、 


百 


一 个 月 后 、 甚 至 


非常 重要 的 一 点 是 ， 本 
最 好 的 合约 。 其 中 


提 


最 容易 交易 的 ， 交 易 量 


革 最 大 的 合约 。 


以 螺纹 钢 期 


易 所 的 规定 ， 流 
货 价 格 。 如 果 目 前 的 3 


动 性 最 强 的 合约 是 指 每 年 1 月 、5 月 
力 合约 接近 交割 日 


期 ， 那 么 


交易 所 会 将 未 来 交易 更 活跃 的 合约 作为 主力 合约 。 这 样 它 就 永远 不 会 交割 ， 


使 交 
约 是 2023 年 1 月 。 


当日 


易 者 更 容易 研究 。 例 如 ， 如 果 当 前 是 2021 年 11 月 ， 此 时 螺纹 钢 的 主力 合 
子 越 来 越 接 近 2023 年 1 月 合约 的 交割 


期 时 ， 主 力 合 约 
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将 变 成 2023 年 5 月 的 合约 。 另 一 方 


交割 月 一 个 月 到 
活跃 。 这 林 


接 而 成 的 长 期 价格 


、 开 仓 和 
进步 尝试 摸索 昌 
分 析 。 


平 仓 等 


技术 分 析 ， 如 技术 指标 ， 是 依靠 历史 的 价 量 信息 来 预测 股本 


方法 [18]。 使 
工具 之 一 ， 寺 


EL 


L 


j 技 术 指 标 进行 趋势 交易 


昌 


是 由 每 年 的 1 月 、5 
方式 的 好 处 是 ， 回 


货 合 


有 成 部 分 。 
j 以 预测 未 


要 


看 ， 根 据 市 场 的 长 期 变化 规律 ， 吕 
四 个 月 的 期 货 合约 是 最 接近 预期 的 现货 价格 ， 因 上 
的 合约 被 连 在 一 起 形成 一 个 连续 的 价格 序列 ， 这 就 是 ; 
因此 ， 螺 纹 钢 主 力 连续 合约 数据 就 
序列 。 使 用 这 
交易 情况 。 而 在 如 今 十 分 成 熟 的 期 货 市 场 中 ， 芍 
己 成 为 市 场 运作 的 习 
8 一 套 分 析 市 场 趋 势 的 方法 


E 离 最 近 的 
交易 也 最 
检 续 合约 。 


月 和 10 月 的 期 货 价 格 拼 
测 结果 也 更 接近 于 实际 
约 ， 期 货 交 
交易 者 们 也 随 着 环境 的 
来 的 趋势 ， 这 就 是 技术 


易 所 、 保 证 


和 趋势 的 一 套 


表明 ， 在 构建 
乔 吕 其 
在 美国 

技术 分 析 在 中 攻 


期 


期 货 市 场 模式 ， 个 人 投资 者 在 中 国 期 货 市 场 上 占 了 大 多 数 。 因 此 ，Li[22] 指 
的 趋势 跟踪 策略 的 表现 不 如 在 美 医 


出 ， 在 中 国 切 


货 市 场 上 可 以 
商品 期 货 市 场 上 产生 显 


货 市 场 上 应 
表现 好 ， 这 体现 在 前 者 的 年 3 


货 市 场 的 表现 与 其 他 


贰 中 


也 证 


著 的 平均 


国 额 收益 。 


已 被 许多 交易 者 证 明 是 
被 用 作 股 票 指示 买卖 信号 的 指标 [19]。Han 等 [20] 提 供 的 ; 
商品 期 货 投资 组 合 时 ， 使 用 简单 的 移动 平均 线 计 
E 常 稳健 地 熏 利 。Clare[21] 
然而 ， 


最 有 利 可 图 的 
正气 
时 策略 在 美国 
趋势 交易 可 以 


究 人 员 发 现 ， 


些 


明了 这 


此 和 


区 不 


国家 或 地 


均 超 额 收 益 较 低 。 而 学 


同 。 因 为 中 国有 独特 的 


期 货 市 场 上 的 
的 问题 与 本 文 


者 们 指 ! 


探索 的 方面 是 一 致 的 ， 因 此 ， 为 了 使 趋势 策略 有 更 好 的 表现 ， 本 文 将 引入 机 
器 学 习 和 深度 学 习 技 术 来 实现 更 高 的 利润 。 


机 器 学 习 和 深度 学 习 
传统 的 技术 指标 策略 相 比 ， 尽 管 后 者 


来 看 ， 这 


者 们 在 计算 机 科学 领域 中 


策略 在 面 对 复 杂 的 市 场 波动 时 很 难 与 之 对 抗 。 可 


多 样 的 预测 模型 。 


担 口 
]EDD 


的 大 量 非 线 己 


而 


这 可 以 通过 人 工 智 能 技术 得 到 实现 。 同 时 ， 事 实 计 
折 分 析 相 比 ， 机 器 学 习 技术 可 以 提高 60-86% 的 交易 效率 [23,24]。 
目前 ， 人 工 智能 技术 正在 各 个 领域 迅速 发 展 。 许 多 基 
市 场 中 ， 例 如 结合 


易 规则 正 被 应 用 于 全 球 股票 
学 习 进 行 交 易 ， 试 图 用 这 些 
Sang[25] 实 验 了 月 


日 于 预测 的 趋势 指标 ， 包 


的 优势 在 人 工 


智能 


具有 趋势 预测 性 


领域 的 蓬勃 发 展 中 逐渐 显现 。 与 


， 但 从 长 期 投资 的 角度 
目 反 ， 近 年 来 ， 学 


了 多 


技术 来 增强 已 经 流行 和 


含 简 


技术 分 析 和 忆 


对 于 股票 市 场 中 产生 


数据 ， 需 要 通过 更 有 效 的 模型 来 识别 隐藏 的 模式 和 复杂 的 关系 ， 


明 ， 与 技术 分 析 或 基本 


F 人 工 智 能 的 交 
[器 学 习 和 深度 
广泛 使 用 的 传统 算法 。 


单 移动 平均 线 〈Simple Moving 


Average，SMA)、 相 对 强 弱 指 数 〈Relative Strength Index，RSI) 和 移动 平均 
收敛 背离 〈(Moving average convergence divergence，MACD )， 并 在 这 三 个 技 
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术 指 标 交 易 方 法 中 分 别 引 入 LSTM 进 行 实验 。 实 证 表明 ， 在 传统 技术 分 析 中 
应 用 神经 网 络 后 总 利润 有 了 明显 的 提高 。 更 有 甚 者 ，Ayala[26] 提 出 了 一 种 将 


技术 指标 与 机 器 学 习 方 法 结合 起 来 产生 交易 决策 的 过 程 。 
(Linear Model，LM)、 人 工 记 
机 森林 (了 Random Forests，RE) 和 支持 向 


SVR) 后 选择 出 具有 最 高 预测 能 力 的 模型 。 此 外 ， 还 分 别 比较 了 三 重 指数 移 


经 过 训练 线性 模型 


经 网 络 (Artificial Neural Network，ANN)、 随 


上 上 


昌 


可 归 〈Support Vector Regression， 


动 平 均线 〈Triple Exponential Moving Average，TEMA ) 和 移动 平均 收 和 敛 /背离 


(MACD ) 策 


但 


并 通 
是 


各 。 挑 选 出 表现 最 好 的 机 器 学 习 模 型 和 技术 指标 策 
合 起 来 并 提出 新 的 交易 规则 。 实 证 结果 显 
的 熏 利 能 力 ， 并 减少 了 交易 次 数 从 而 较 少 交易 成 本 的 付出 。 


示 ， 这 


各 ， 将 两 者 结 
混合 模型 提高 了 每 个 策略 


综 上 所 述 ， 众 多 研究 者 发 现 了 


过 多 次 实验 证 明了 


经 网 络 在 量化 金融 中 列 售 
经 网 络 在 预测 股票 和 商品 期 货 价格 方面 的 可 行 性 。 


的 强大 力量 ， 


， 这 并 不 能 概括 地 说 ， 神 经 网 络 的 价格 预测 性 能 优 于 传统 的 技术 指标 ， 


而 


将 更 精确 地 逢 


不 能 因为 深度 学 习 技 术 的 流行 性 而 否 机 器 学 习 技 术 的 性 能 。 
jLSTM 神 经 网 络 的 信息 传递 方式 的 特点 ， 利 


AL 


换 句 话说， 本 文 的 


究 目 的 是 利 


指标 的 趋势 预测 能 


3. 研究 方法 


了 .71. 方法 背景 和 原理 


3.1.7. ZL97 神 


LSTM 是 一 
间 序 列 ， 具 有 记忆 长 、 
记忆 结合 起 来 ， 
依赖 性 [28]。 梯 度 消 失 的 主要 


经 网 络 原理 


解决 了 RNNI 


神经 网 络 ， 是 循环 神经 网 络 CRNN) 的 变种 ， 可 用 了 


因此 ， 本 文 
它 对 数据 特征 


进行 合理 提取 ， 并 将 机 器 学 习 模 型 作为 预测 器 来 预测 期 货 价 格 的 运动 方向 。 
j 机 器 学 习 和 深度 学 习 技术 来 提升 传统 技术 


处 理 时 


短期 信息 的 能 力 [27]。 它 通过 门 控 将 短期 记忆 与 长 期 
于 梯度 消失 和 梯度 爆炸 的 问题 而 产生 的 长 期 


六 
六 


因此 它 可 以 动态 地 掌握 数据 的 结构 并 保持 较 强 的 可 预测 性 。 


省 多 


站 体 地 ， 


从 而 删除 或 


许 任意 长 距离 的 依赖 关系 之 间 的 学 习 。 简 而 言 2 之 
比 ，LSTM 在 长 序列 中 能 够 有 更 好 的 表现 。 此 外 ， 
侈 改 细胞 状态 的 信息 ， 为 信息 有 选择 地 传递 下 去 提供 路 径 。 


原因 是 计算 递归 导数 。LSTM 可 以 解决 该 问题 ， 


， 这 意味 着 与 RNN 相 
LSTM 的 门 机 制 可 调节 信息 


它 由 


Sigmoid 层 〈sigmoid layers)、 双 | 
layers) 和 点 对 点 的 乘法 运 
LSTM 引 入 了 可 讨 


1 正 切 层 (hyperbolic tangent 


Cpoint-wise multiplication operations) 组 成 [29]。 


上 算 的 记忆 单元 ， 可 以 有 效 地 将 记忆 和 输入 进行 远程 关联 ， 


每 个 单元 的 关键 


2022 


Input layer 


Ce 


Hidden layer 
心 


Output layer 


图 2. 长 短期 记忆 网 络 结构 和 记忆 单元 结构 


组 成 部 分 是 一 个 输入 层 〈input layer) 、 一 个 隐藏 层 hidden layer) 和 一 个 输 
出 层 〈output layer)， 图 2 展示 了 LSTM 架 构 ， 以 及 计算 方程 如 下 : 


万 二 GO(WHzj_l 十 全/Peoc 十 Dr 
天 一 GO(Wzj 1 十 玫 co 十 思 ) 
Cr 一 tanh(Wzzj -1 十 凤 co 十 be) 
(D) 
Ci 三 万 :co 十 :G 


Or 一 G( 了 pi 于 帮 oo 十 bo) 


方 三 Of tanh(c') 


其 中 ，c 是 时 间 t 的 单元 状态 , h, 隐藏 状态 , W 为 权重 ; ji, fand 0 分 别 是 输入 
门 ， 遗 忘 门 和 输出 门 ; bj 是 偶 差 ; a 是 sigmoid 激 活 函数 ; tanh 是 tangent 激 活 函 
数 ; x% 是 当前 输入 [31]. 
值得 注意 的 是 ， 在 方程 1 中， 当前 时 刻 的 单元 状态 c 是 由 前 一 个 单元 状 
态 c-1 被 遗 筷 站 8 乘 以 其 元 素 ， 然 后 当前 输入 单元 状态 ec 被 输入 | 二 乘 以 其 元 
素 ， 然 后 两 个 乘积 相 加 。 这 样 ， 当 前 记忆 g& 和 长 期 记忆 c_ 1: 可 以 结合 起 来 ， 形 
成 新 的 单元 状态 c。 这 样 计算 的 好 处 是 ， 由 于 遗忘 门 的 控制 ， 它 可 以 保留 很 
久 以 前 的 信息 ， 同 时 由 于 输入 门 的 控制 ， 它 可 以 避免 当前 不 相关 的 内 容 进 入 
记忆 。 因 此 ， 本 文 利用 LSTM 这 一 特性 探索 长 序列 中 的 有 效 特征 选择 采用 基 
于 LSTM 的 特征 提取 方法 。 这 样 做 的 原因 有 两 个 。 首 先 ， 为 了 确认 基于 人 工 智 
能 的 价格 预测 器 是 可 交易 的 ， 必 须 考 虑 到 预测 结果 可 以 在 实际 交易 中 使 用 。 
结合 计算 速度 和 期 货 价 格 的 实时 生成 速度 ， 在 这 种 情况 下 选择 做 长 序列 预测 
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效 的 特征 。 


是 合理 的 。 其 次 ， 


LSTM 神 经 网 络 具 有 信息 可 传递 性 ， 可 以 保留 长 序列 中 有 


3 了 3.1.2. ZLS7WM 神 经 网 络 的 特征 提取 方法 


本 文 将 通过 基于 LSTM 的 网 络 使 用 特征 提取 方法 来 降低 数据 维度 ， 并 从 杂乱 


的 信息 中 提取 有 月 


提取 后 的 输 日 


3。 


Input 
features 


被 有 


的 特 行 


FE。 模型 的 输入 包括 期 货 的 历史 价格 序列 、 技 术 指 标 
和 从 价格 序列 中 提取 的 时 间 序 列 特征 。 这 些 输入 将 被 LSTM 进 一 步 处 理 ， 


而 


日 作 机 器 学 习 分 类 器 的 学 习 输 入 。 最 终 使 用 这 些 提 取 的 有 
效 特征 来 训练 分 类 器 模型 并 预测 期 货 价 格 的 涨 跌 趋 势 。 本 文 提 出 的 方法 如 图 


Feature Output 


extraction features Output 
和 Extracted 
LSTM 
必 会 
LSTM @: 
了 熏 
LSTM ; @ 
Dropout Dropout 四 @ 
; | be 
LSTM 个 
下 二 @@ @ 
多 @ @ 
LSTM 便 
图 3. 基于 LSTM 的 特征 提取 机 制 


一 个 输入 层 、 
结构 的 基本 组 成 部 分 。 然 而 ， 神 经 网 络 有 两 个 潜在 的 问题 可 能 会 影响 模 
型 的 训练 任务 。 一 个 是 梯度 消失 ， 导 致 收敛 困难 ， 另 一 个 是 过 度 拟 合 的 


问题 ， 导 致 测试 集 上 的 性 能 表现 不 佳 。 


两 个 LSTM 层 、 两 个 全 连接 层 和 一 个 输出 层 是 这 个 网 


入 了 Dropout 层 ， 即 在 每 次 训练 的 时 候 ， 随 机 让 预 设 数量 的 神经 元 停止 


因此 ， 本 文 在 每 个 LSTM 层 之 后 加 


作 ， 目 的 是 提高 LSTM 网 络 的 泛 化 能 力 。 得 注意 的 是 ， 虽 然 输入 数据 已 经 通 


络 


二 


过 LSTM 和 Dropouts 的 计算 被 提取 出 来 ， 但 特征 仍然 需要 通过 全 连接 层 进行 


平 化 处 理 


局 | 
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3.2. 研究 设计 

3.2.17. 基于 机 器 学 习 过 滤器 的 趋势 跟踪 交易 策略 

我 们 通过 以 下 三 个 步骤 构建 了 一 个 基于 机 器 学 习 的 趋势 跟踪 交易 系统 。 1) 构 
建 机 器 学 习 预 测 器 ， 旨 在 利用 期 货 的 历史 数据 预测 价格 涨 跌 趋势 。 有 具体 过 程 
在 章节 3.2.2 中 讨论 ;2) 趋势 交易 策略 的 构建 ， 使 用 该 策略 生成 交易 信号 。 主 


要 概念 在 章节 3.2.3 中 呈现 ， 3) 趋势 交易 策略 和 分 类 器 的 组 合 ， 新 的 交易 规 
则 使 用 步骤 《〈1) 中 产生 的 预测 值 与 步骤 〈2) 中 的 交易 信号 进行 比较 ， 也 就 


是 用 基于 机 器 学 习 的 模型 过 滤 交 易 信号 。 提 出 的 具体 方法 将 在 章节 3.2.4 中 讨 
论 。 


总 体 构 建 过 程 如 图 4 所 示 。 


图 4. 基于 机 器 学 习 过 滤器 的 趋势 交易 策略 流程 


首先 ， 需 要 对 价格 预测 的 总 体 框 架 进 行 构建 。 获 取 期 货 历 史 数据 作为 基 
础 数据 ， 所 i 后 用 于 标签 和 特征 制作 。 有 基体 来 说 ， 价 格 涨 跌幅 是 通过 收盘 价 序 
列 计算 出 来 的 ， 确 定 涨 跌 的 阀 值 则 参考 了 止 损 机 制 ， 因 为 交易 策略 中 普遍 会 
放置 保护 性 止 损 。 从 而 预测 目标 被 映射 到 两 个 类 别 〈 涨 ， 跌 )， 这 便 是 模型 的 
标签 ， 用 以 执行 二 分 类 任务 ， 其 计算 公式 为 


| O) 
局 
1， 广 去 0.01 
P(D) = (3) 
0， 广 >-0.01 


其 中 ，r 是 时 刻 的 涨 跌 比率 , p, 是 时 刻 收盘 价 ， 1 多 是 止 重点 ，-1% 是 止 损 点 ， 
两 者 是 定义 涨 跌 的 闪 值 ，P, 是 价格 的 涨 跌 方 向 ， 洁 是 涨 而 :0 是 跌 。 
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此 外 ， 从 期 货 数据 中 计算 的 技术 指标 可 以 作为 特征 组 之 一 。 因 为 在 金融 
数学 领域 经 常 提 到 时 域 的 可 观察 性 ， 所 以 从 价格 的 历史 轨迹 中 也 可 以 提取 出 
时 间 序 列 特征 作为 模型 的 特征 组 。 因 此 ， 本 文采 用 三 组 特征 分 别 是 基础 数 
据 特 征 ， 技 术 指 标 特征 和 时 间 序 列 特征 。 采 用 LSTM 神 经 网 络 对 这 些 特 征 组 
进行 提取 后 ， 数 据 集 按 照 滑 动 窗口 的 方式 划分 训练 集 和 测试 集 ， 分 别 对 这 些 
样本 做 标准 化 处 理 ， 然 后 将 其 应 用 到 六 个 不 同 的 机 器 学 习 分 类 模型 中 进行 训 
练 、 预 测 以 及 结果 评估 。 

预测 模型 的 框架 确定 后 ， 下 一 个 任务 是 编写 一 个 趋势 跟踪 交易 系统 。 许 
多 投资 者 认为 ， 历 史 数 据 可 以 为 未 来 的 价格 走势 提供 指示 ， 因 此 由 技术 分 析 
得 出 的 交易 规则 已 经 成 为 许多 交易 者 关注 的 焦点 [39]。 因 此 ， 本 文 在 设计 交 
易 规则 时 采用 了 普遍 交易 者 选 定 的 参数 ， 基 于 唐 奇 安 通道 指标 的 基本 交易 规 
则 编写 了 一 个 趋势 跟踪 交易 系统 。 通 过 选 定 一 个 周期 参数 来 绘制 通道 ， 从 而 
产生 的 交易 信号 。 最 后 ， 这 一 步 产生 的 交易 信号 与 分 类 器 预测 的 值 相 结合 会 
得 到 最 终 的 交易 方向 。 这 个 结合 的 交易 系统 的 性 能 表现 可 以 通过 回 测 进行 评 
十 。 


se 


3.2.2. 基于 上 STM 的 特征 提取 和 机 器 学 习 分 类 器 

期 货 的 价格 变动 符合 金融 时 间 序 列 的 性 质 ， 也 就 是 资产 价值 随 着 时 间 的 推移 
而 变化 。 因 此 ， 机 器 学 习 模 型 能 够 捕捉 到 价格 上 涨 和 下 跌 的 交易 信号 。 整 个 
构建 过 程 如 图 5 所 示 。 


Features 


图 $. 机 器 学 习 模型 构建 流程 图 


首先 ， 获 取 期 货 的 历史 价格 数据 ， 包 含 收 盘 价 、 开 盘 价 、 最 高 价 、 最 低 
价 和 交易 量 。 这 五 种 属性 作为 原始 基础 数据 集 ， 并 计算 收盘 价 制作 分 类 标签 。 
在 特征 工程 阶段 中 ， 如 果 只 使 用 基础 数据 训练 模型 可 能 会 暴露 学 习 能 力 差 和 
模型 复杂 度 低 的 缺点 ， 从 而 导致 过 拟 合 的 问题 。 因 此 ， 为 了 构建 更 丰富 的 
特征 组 ， 本 文 参考 Dvoryatkina[34] 的 方法 ， 使 用 技术 指标 为 特征 ， 并 通过 TA- 
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Lib 库 [35] 进 行 计算 ， 而 这 些 是 由 价 量 信息 计算 出 来 的 。 使 用 技术 分 析 来 预测 
期 货 价 格 趋势 是 有 一 定 的 优势 ， 例 如 它 有 广泛 的 使 用 范围 并 对 所 有 类 型 的 交 
易 总 是 有 效 。 同 样 地 ， 时 间 序 列 中 隐 含 的 特征 也 十 分 重要 ， 比 如 使 用 自 回归 
条 件 异 方差 法 在 预测 股票 时 涉及 方差 和 波动 率 。 因 此 ， 本 文 使 用 TsFeatures 来 
计算 时 间 序 列 分 析 的 相关 特征 ， 并 在 随后 的 实验 中 证 明 其 有 效 性 。 通 过 以 上 
的 计算 ， 三 组 特征 便 组 建 好 了 ， 但 这 样 的 特征 组 数据 量 大 且 并 不 是 每 个 特征 
对 模型 的 训练 都 有 贡献 。 因 此 ， 本 文 设计 实验 来 比较 特征 组 的 组 合 ， 并 选择 
最 优 组 合作 为 特征 提取 步骤 的 输入 数据 。 经 过 选择 合适 的 特征 组 后 ， 需 要 进 
行 LSTM 神 经 网 络 提取 特征 ， 使 原来 112 维 的 输入 数据 减少 到 16 维 的 输出 。 考 
虑 到 期 货 价 格 的 强 时 间 序 列 特性 ， 随 机 抽样 的 数据 集 划 分 的 方法 并 不 适用 。 
因此 ， 在 特征 提取 后 采用 滑动 窗口 法 对 数据 集 进 行 划分 [33]。 

随后 ， 采 用 Z-Score 标 准 化 的 方法 统一 特征 组 的 量 纲 。 在 预测 阶段 ， 本 
文 使 用 六 种 机 器 学 习 模 型 作为 分 类 器 来 预测 期 货 的 价格 趋势 ， 包 括 逻 辑 回归 
(Logistic Regression，LR ) 、k- 近 邻 (kNearstNeighbors，KNN ) 、 朴 素 贝 叶 斯 
分 类 器 (Naive Bayesian Classifer，NBC) 、XGBoost、CatBoost 和 LightGBM 分 
类 器 。 在 比较 分 类 任务 的 性 能 时 ， 还 需要 使 用 混 请 矩阵 来 计算 准确 率 〈Accuracy， 
ACC) 和 F1 分 数 来 评估 预测 结果 。 


3 了 .2.3， 唐 奇 安 通道 交易 策略 

唐 奇 安 通道 指标 是 从 海 优 交易 规则 演变 而 来 ， 海 龟 交 易 规则 是 理 查 德 ... 唐 奇 
安 在 1950 年 开发 的 一 个 强大 的 趋势 跟踪 指标 。 它 作为 一 种 辅助 交易 的 工具 经 
受 住 了 时 间 的 考验 ， 被 常用 于 商品 期 货 和 股票 交易 中 。 唐 奇 安 通道 的 原理 并 
不 复杂 ， 当 价格 在 通道 的 中 间 和 顶部 之 间 时 ， 它 代表 着 趋势 是 上 升 的 。 当 价 
格 在 通道 的 中 间 带 和 底部 之 间 时 ， 它 表示 趋势 是 下 降 的 [36]。 本 文 使 用 两 个 
通道 ， 上 轨 和 下 轨 ， 其 计算 方法 如 下 

Upper = max( 瓦 ,V) 


(4) 
Lower 王 min(Z,N) 

Upper 上 轨 是 由 过 去 N 条 价格 序列 的 最 高 价 刀 形成 的 ， 相 反 ，Lower 下 轨 是 由 
过 去 N 条 价格 序列 的 最 低 价 Z 形 成 的 。 该 系统 的 交易 规则 是 如 果 最 新 价 向 上 突 
破 了 上 轨 时 ， 则 发 出 买 入 信号 ; 反之 ， 如 果 最 新 价 向 下 穿 过 了 下 轨 时 ， 则 发 
出 卖 出 信号 。。 同 时 ， 该 策略 需要 考虑 滑 点 值 〈 即 实际 交易 价格 和 预 设 交 易 价 
格 之 间 的 变化 量 ) 和 止 僵 止 损 机 制 ， 在 已 经 持 有 多 头 或 空头 的 情况 下 ， 如 果 
价 利 比 率 上 升 到 一 定 的 百分比 〈 如 1% )， 就 关闭 多 头 或 空头 ， 这 样 的 机 制 与 
标签 制作 中 的 冰 值 设置 相对 应 。 
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3 了 .2.4. 基于 机 器 学 习 分 类 器 和 唐 奇 安 通 道 交 易 系 统 的 交易 规则 


一 个 结合 了 预测 器 和 技术 指标 的 交易 系统 会 产生 一 个 新 的 交易 规则 。 根 据 唐 
奇 安 通道 的 交易 系统 ， 该 策略 在 回 测 期 间 产 生 买 入 和 卖 出 信号 ， 多 头 信和 号 被 
标记 为 21， 空头 信号 被 标记 为 "0'。 在 同一 交易 时 刻 ， 机 器 学 习 预 测 器 产生 的 
上 升 趋势 类) 和 下 降 趋 势 0 类 ) 的 价格 变动 预测 值 。 如 果 策 略 和 预 
测 器 都 产生 阅 ' 的 信号 ， 那 么 指示 着 投资 者 买 入 ， 如 果 是 0， 指示 着 投资 者 卖 
出 。 这 就 是 交易 信号 的 过 滤 规 则 ， 只 有 当 信 和 号 是 基于 唐 奇 安 通道 产生 ， 并 且 
预测 器 也 指向 相同 的 方向 时 ， 才 会 持仓 。 
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图 6. 机 器 学 习 和 趋势 交易 策略 的 系统 性 结合 


从 经 济 表现 来 看 ， 对 基于 机 器 学 习 方 法 的 交易 系统 进行 评估 也 是 至 关 习 
要 的 。 回 测 可 以 将 原始 策略 的 表现 与 过 滤 后 的 策略 的 表现 进行 比较 。 通 过 比 
较 使 用 基于 机 器 学 习 方 法 前 后 的 胜率 、 净 利润 、 收 益 率 、 年 化 收益 率 、 最 大 
跌幅 、 人 恢复 系数 〈 即 净利 润 与 最 大 跌幅 的 比率 )、 总 利润 和 总 交易 次 数 来 评 
估 预 测 模型 的 应 用 是 否 带 来 了 积极 的 经 济 效益 ， 如 图 6。 同 时 也 用 这 些 标准 
从 6 个 不 同 的 分 类 器 中 选择 适合 当前 策略 的 分 类 器 ， 主 要 对 比 胜 率 和 总 利润 。 


IN 


4. 实验 


实验 设置 分 为 三 个 主要 部 分 。 第 一 部 分 是 特征 选择 ， 这 是 特征 工程 的 一 个 习 
要 步骤 。 其 目的 是 选择 适合 训练 模型 的 特征 组 。 在 这 一 步 中 ， 分 别 使 用 时 间 
长 度 为 三 个 月 和 六 个 月 的 价格 数据 ， 对 由 不 同 特征 的 组 合 进行 实 验 。 使 用 Fl1- 
measure 和 准确 率 作 为 评价 标准 。 最 后 选 出 符合 模型 的 特征 ， 并 列 出 有 代表 性 
的 特征 且 用 实例 加 以 说 明 ， 有 共 体 内 容 见 第 章节 4.2。 第 二 部 分 是 预测 模型 实 
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验 的 设置 。 实 验 设置 从 建立 LSTM 模 型 开始 ， 从 章 贡 4.2 的 实验 中 选 出 的 特征 
组 被 输入 到 LSTM 模 型 。 随 后 进行 数据 集 划 分 和 归 一 化 处 理 。 完 成 上 述 设置 
后 ， 进 入 机 器 学 习 预 测 环节 ， 最 后 得 出 分 类 器 预测 值 和 评价 分 数 。 第 三 部 分 
是 唐 奇 安 交 易 系 统 的 参数 设置 和 策略 回 测 ， 此 步 将 生成 交易 信号 和 回 测评 价 

执行 上 述 步 又 后 ， 得 到 的 实验 结果 有 以 下 几 个 运用 目的 。 执 行 上 述 步 
又 后 ， 我 们 得 到 的 实验 结果 有 以 下 几 个 目的 。 首 先 ， 六 个 不 同 的 ML 分 类 器 
的 F1 分 数 和 准确 率 表现 可 以 帮助 我 们 选择 目前 表现 最 好 的 预测 器 。 第 二 ， 将 
唐 奇 安 指 标 产 生 的 交易 信号 与 所 选 分 类 器 产生 的 预测 信号 进行 比较 。 为 了 获 
得 使 用 基于 机 器 学 习 的 信号 过 滤器 后 的 唐 奇 安 交 易 系 统 的 胜率 和 净利 润 ， 这 
两 个 回 测 指标 与 章节 4.3 中 交易 系统 的 回 测 结果 进行 比较 ， 观 察 信 号 过 滤器 是 
否 有 助 于 唐 奇 安 交 易 系统 提高 其 经 济 绩效 。 


和 涉 17. 数据 集 


数据 集 包 括 具 有 复权 价格 的 螺纹 钢 期 货 〈 上 海 期 货 交 易 所 )， 使 用 主力 连续 
合约 ， 交 易 日 在 2016 年 1 月 至 2022 年 6 月 之 间 ， 共 108,000 条 5 分 钟 久 线 数 据 。 另 
外 ， 为 了 进一步 验证 本 文 提出 的 系统 的 可 行 性 ， 使 用 黄金 〈 上 海 期 货 交 易 所 ) 
和 豆粕 《大 连 商品 交易 所 ) 期 货 的 数据 进行 更 多 的 实证 分 析 。 预 测 的 目标 设 
定 为 两 类 标签 (上 涨 ， 下 跌 ) 。 


和 2. 特征 选择 


基于 TA-Lib 开 源 库 计 算出 112 个 技术 指标 特征 和 Kats 工 具 库 中 的 TsFeatures 库 
计算 出 46 个 时 间 序 列 特征 。 最 终 ， 由 基础 特征 组 ， 技 术 指 标 特征 组 和 时 间 序 
列 特征 组 构成 所 有 特征 数据 。 每 个 类 别 分 别 列 出 代表 性 的 指标 并 给 出 了 一 些 
详细 的 例子 ， 但 并 不 是 所 有 的 112 个 指标 都 被 列 出 ， 有 具体 特征 表 1 所 示 。 
这 里 讨论 了 六 类 技术 指标 。 重 琵 研 究 类 中 包含 最 多 的 是 移动 平均 线 ， 它 
是 技术 分 析 中 最 常见 的 指标 类 型 。 以 几 个 指标 的 详细 解释 为 例 [37]。 
MAS 移动 平均 指标 ) 是 指 连 续 的 S$ 个 时 间 间 隔 的 价 
格 平均 值 。 
BBANDS ( 布 林带 指标 ) 是 根据 统计 学 中 的 标准 差 原 
理 设 计 的 ， 它 包括 中 轨 、 上 轨 和 下 轨 。 
动量 指标 旨 在 分 析 股 票 价格 波动 的 速度 ， 研 究 波动 过 程 的 加 速 、 减 速 和 
性 ， 以 及 股票 价格 由 动 转 静 或 静 转 动 的 现象 。 
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RSI 


《相对 强 弱 指 标 ) 通过 
期 内 股价 总 变化 平均 值 的 百分比 来 评估 多 头 和 空 


衡量 股价 总 涨幅 占 


定时 
头 


的 力量 。 该 震荡 指标 表明 最 近 价格 是 否 上 涨 或 下 跌 


过 快 [38] 。 
成 交 量 指标 使 用 成 交 量 数据 来 计算 其 运动 趋势 ， 从 而 推断 出 股价 的 趋 
势 。 
OBV “〈 能 量 潮 ) 是 由 OBV 值 和 OBV 线 组 成 。 它 主要 用 
于 判断 量 价 关 系 ， 即 OBV 曲 线 是 否 与 股价 运动 方向 
一 致 
波动 指标 是 指 金融 资产 价格 的 波动 程度 ， 是 衡量 资产 收益 的 不 确定 性 ， 
用 于 反映 金融 资产 的 风险 水 平 。 
ATR “平均 真实 波动 范围 ) 是 在 一 定时 期 内 对 价格 移 
动 平 均线 进行 平均 化 后 的 交易 波动 率 。 
表 1. 三 组 特征 组 及 其 分 类 
村 征 组 ”特征 类 型 特征 名 称 数量 
基础 特征 收盘 价 ， 开 盘 价 ， 最 高 价 
最 低 价 ， 成 交 量 
重奏 研究 MA5, EMA, BBANDS, SAR， 
TEMA, WMA 等 
MACD, ROCP, RSL 
技术 指标 动量 ADX, APO, CCL， 112 
MEFL WILLR 等 
成 交 量 OBV, AD, ADOSC 
波动 率 ATR,NATR, TRANGE 
AVGPRICE, MEDPRICE, TYPPRICE， 
价格 转换 
WCLPRICE 
局 归 HT_DCPERIOD, HT_DCPHASE， 
HT_PHASOR, HT_ TRENDMODE 
鸭 值 ， 方 差 ， 香 农 精 
单位 根 检验 ， 自 相关 系数 ， 
时 序 特 征 KPSS 单 位 根 检验 ， 自 相关 系数 辽 
相关 方程 , 偏 自 相关 方程 ， 季 节 性 程度 ， 


本 文 设 计 了 两 组 实验 来 选择 特征 组 


练 集 ， 


用 2 个 月 


的 数据 作为 测试 集 。 


尖锐 性 等 


。 第 一 组 实验 用 6 个 月 的 数据 作为 训 
分 割 训练 集 和 测试 集 的 方法 是 滑动 窗 
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法 ， 其 具体 含义 在 章节 4.3 中 提 到 。 第 二 组 实验 使 用 13 个 月 的 周期 数据 作为 训 
练 集 ， 同 样 ， 测 试 集 的 周期 为 2 个 月 。 换 句 话 说， 用 不 同时 间 长 度 的 训练 集 来 
训练 模型 ， 但 测试 的 是 同样 时 间 长 度 的 周期 。 每 组 实验 有 四 个 变量 ，”base”、 
”base kats'、 ”base_ta 、 ”base_ta kats”， 分 别 指 基础 数据 、 基 础 数据 和 时 序 特 
征 、 基 础 数据 和 技术 指标 ， 以 及 基础 数据 和 时 序 特征 和 技术 指标 。 

为 了 达到 更 好 的 预测 效果 ， 我 们 使 用 了 与 最 终 实验 设置 相同 的 ML 模 
型 ， 即 LR、KNN、NBC、XGBoost、CatBoost 和 LightGBM 分 类 器 ， 并 使 用 F1- 
Score、ACC 和 AUC (曲线 下 面积 ) 作为 评价 指标 来 协助 选择 特征 集 。 以 实 
验 1 的 ”base'" 组 为 例 ， 在 特定 的 时 间 内 使 用 该 特征 组 训练 了 六 个 不 同 的 分 类 
器 ， 会 得 到 2021 年 1 月 1 日 至 2022 年 7 月 1 日 的 测试 集 评价 结果 。 这 样 的 结果 总 
共有 10 组 ， 取 这 些 结果 的 平均 值 后 ， 可 以 得 到 6 个 分 类 器 中 每 个 分 类 器 的 基 
于 ”base' 特 征 组 训练 的 性 能 表现 。 根 据 F1-Score、ACC 和 AUC 分 别 取 所 有 分 类 
器 的 平均 值 ， 可 以 得 到 ”base' 特 征 组 在 这 三 个 指标 上 的 表现 。 这 两 个 实验 的 
结果 如 图 7 所 示 。 根据 实验 结果 ， 无 论 是 使 用 时 间 长 度 为 13 个 月 的 训练 集 还 


Scores 


base base_kats base ta base ta_kats 
Feature sets 


图 7. 特征 选择 的 实验 结果 


是 6 个 月 的 训练 集 ，”base”* 组 的 F1 值 都 比较 低 ， 还 没有 达到 0.5。 虽 然 AUC 值 表 
现 突出 ， 但 我 们 不 考虑 只 使 用 基础 数据 作为 特征 的 情况 。 在 F1 值 方面 表现 不 
佳 的 还 有 ”base ta 组 ， 尽 管 它 比 'base" 组 有 进步 ， 但 不 能 与 其 余 两 组 相 比 。 从 
直方 图 上 看 ，”base_kats” 组 在 三 个 评价 分 数 中 都 表现 平均 ， 这 意味 着 它 在 很 多 
维度 上 都 有 良好 的 表现 。”base_ta_kats' 组 的 表现 也 不 差 ， 从 有 具体 数值 上 看 ， 两 
个 F1 值 和 准确 率 的 差别 非常 小 ， 但 从 AUC 上 看 ， 后 者 的 得 分 更 高 。 除 了 需要 
考虑 上 述 实验 结果 ， 深 度 学 习 神 经 网 络 需 要 通过 大 量 的 数据 进行 训练 ， 所 以 
最 终 选 择 了 ”base ta kats'〈 有 163 个 维度 ) 作为 特征 组 ， 该 数据 集 包 括 历史 价 
格 数据 、 技 术 分 析 指标 和 时 间 序 列 特征 。 
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和 4 3. 模型 实验 设置 


本 文 使 用 Python3.7.0，ScikitLearn 用 于 机 器 学 习 技 术 ，PyTorch 用 于 深度 学 习 
训练 任务 。 代 码 运行 环境 如 表 2 所 示 。 


表 2. 系统 环境 


CPU Intel(R) Core(TMD 17-10700K 
RAM 32.0 GB 
GPU NVIDIA GeForce RIX 2080 SUPER 
System Windows 10 
Python Version Python3.7.0 
Scikit-Learn Version 1.0.2 
了 PyTorch Version 1.6.0 
CUDA Version 11.7.101 


预测 模型 的 总 体 实验 流程 如 图 4 所 示 。 在 获得 期 货 价 格 数据 后 ， 利 用 这 
些 数据 产生 特征 和 标签 。 其 中 ， 产 生 的 特征 需要 进行 特征 选择 ， 这 是 章节 
4.2 的 实验 结果 ， 使 用 ”base ta_kats* 组 作为 特征 组 。 接 下 来 ， 经 过 特征 提取 后 ， 
这 些 提 取 的 特征 被 输出 作为 机 器 学 习 预 测 器 的 学 习 特 征 。 采 用 滑动 窗口 划分 
法 使 特征 组 和 标签 被 分 为 训练 集 和 测试 集 。 随 后 ， 这 两 个 数据 集 被 分 别 归 一 
化 ， 学 习 特 征 便 被 送 入 分 类 器 进行 训练 产生 最 终 的 预测 值 。 

LSTM 网 络 的 主要 结构 包括 一 个 输入 层 ， 两 个 LSTM 层 ， 每 个 层 后 面 有 一 
个 Dropout 层 ，Dropout 率 设置 为 0.1， 且 采用 Softmax 作 为 激活 函数 ， 有 具体 参数 
见 表 3。 神经 网 络 使 用 Mini-Batch 方 法 来 训练 模型 ， 选 择 一 定量 的 数据 进行 训 
练 ， 然 后 计算 损失 函数 ， 更 新 梯度 ， 这 样 就 没有 复杂 的 计算 ， 也 就 避免 了 训 
练 缓慢 的 情况 。 将 epoch 的 大 小 设置 为 90，batch 大 小 为 32， 用 于 训练 样本 。 石 
每 个 epoch 中 ， 从 训练 集中 选取 32 个 样本 进行 训练 ， 直 到 训练 集中 的 所 有 数 志 
都 训练 完毕 ， 然 后 再 使 用 下 一 个 epoch。 交 叉 粒 损失 函数 被 用 作 损 失 函 数 来 
衡量 输出 标签 和 真实 情况 之 间 的 差异 。 本 文 参数 的 设置 与 参考 龙 奥 明 [8] 的 文 
献 。 


姓 


Qt 


其 次 ， 将 数据 分 为 训练 集 和 测试 集 的 方式 是 滑动 窗口 划分 法 。 这 是 
一 种 划分 时 间 线 的 方法 ， 它 根据 指定 的 单位 长 度 来 框 定时 间 序 列 
滑动 窗口 为 一 个 单位 。 本 文 设 置 步 长 为 ?个 月 ， 窗 口 大 小 为 13 个 月 ， 换 名 
话说 ， 预 测 值 是 递归 产生 的 ， 每 次 会 产生 2 个 月 的 预测 范围 。 有 具体 来 说 ， 
初始 数据 点 为 2016 年 12 月 1 日 ， 此 后 13 个 月 内 的 数据 为 第 一 个 训练 集 ， 标 
记 为 'trainl1;， 2018 年 1 月 1 日 至 3 月 1 日 为 第 一 个 测试 集 ， 标 记 为 'test]"。 同 


每 个 


必 


二 
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表 3. 深层 LSTM 神 经 网 络 的 具体 参数 


Parameters Values 
LSTM-layerl hidden_size 60 
LSTM-layer2 hidden_size 65 

Densel out_ features 16 

Dense2 out_features 2 

Dropout rate 0.1 
Activation Softmax 


样 ，2017 年 2 月 1 日 开始 后 13 个 月 的 数据 为 第 二 个 训练 集 ， 标 注 为 "train2”; 
2018 年 3 月 1 日 至 2018 年 5 月 1 日 的 数据 为 第 二 个 测试 集 ， 标 注 为 'test2"。 以 此 类 
推 ， 直 到 整个 数据 集 划 分 完毕 。 有 具体 情况 见 图 


train1 test1 
区 本 | 医 避 攻 本 区 本 全 本 | 二 二 医 芭 加 芭 碳 芭 硬 避 因 避 帮 司 
Data ka ks 受 本 司 几 < 要 到 量 二 有 几 < kn 
train2 test2 
[patel dd | 由 dd | didsl dsldi ld 
Data Ha 到 L 司 加 下 加 < 本 < kn 


trainm testm 


[pate| du | du | dy | qd | .| dh， 


ES 是 汪 古本 全 靖国 国生 三 


dns dhn .> dh 


图 8. 滑动 窗口 划分 数据 集 方法 


利用 2016 年 12 月 1 日 至 2022 年 7 月 1 日 的 数据 ， 用 这 种 方法 将 数据 集 分 
为 27 组 〈 特 定 周期 的 测试 集 和 训练 集 为 一 组 )， 也 就 是 会 产生 27 组 预测 数据 。 
以 防 信息 泄露 ， 需 要 分 别 对 测试 集 和 训练 集 进 行 Z-Score 标 准 化 。 详 细 来 说 ， 
对 于 样本 序列 xz,z;,… 要 根据 以 下 公式 进行 标准 化 


Xi 一 苞 


六 一 (9) 


史 
其 中 攻 为 样本 平均 数 ，s 为 样本 标准 差 ，yV 为 平均 位 置 为 0， 方 差 为 1， 无 量 纲 
的 数据 。 如 果 在 细 分 数据 集 之 前 ， 先 从 整个 数据 集 计 算出 样本 均值 和 样本 标 
准 差 ， 那 么 训练 集 就 包含 了 测试 集 的 信息 ， 而 测试 集 的 数据 也 包含 了 训练 集 


册 
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的 信息 。 反 之 ， 如 果 对 训练 集 和 测试 集 分 别 进行 归 一 化 操 


述 情况 。 


作 ， 就 可 以 避免 上 


最 终 ， 这 些 标准 化 的 数据 被 送 入 六 个 不 同 的 机 器 学 习 分 类 器 进行 预测 ， 


且 使 用 Fl1-measure 和 准确 度 值 对 生成 的 预测 进行 评估 。 


44 唐 奇 安 交 易 系统 设置 


回 测 ， 然 后 产生 交易 信号。 


在 实验 中 ， 唐 奇 安 通道 指标 中 设置 N=24 作 为 上 下 轨 的 计 香 
略 的 交易 条 件 为 1% 正 损 点 ， 滑 点 成 本 为 1 元 人 民 币 。 在 回 
集 相 同 的 时 间 ， 即 2018 年 1 月 1 日 至 2022 年 6 月 30 日 。 参 数 设 定 后 ， 对 策略 进行 


参数 。 同 时 ， 该 策 
测 期 间 使 用 与 测试 


这 些 结果 直接 与 机 器 学 习 预 测 结果 整合 ， 比 较 两 


者 的 交易 方向 ， 从 而 完成 了 信和 号 过 滤 。 同 时 ， 生 成 的 回 测 
含 胜率 、 净 利润 、 收 益 率 、 年 化 收益 率 、 最 大 跌幅 和 净利 润 与 最 大 跌幅 的 比 


率 
2 
O 


S. 实证 分 析 


章节 5.1 和 章节 5.2 是 以 螺纹 钢 期 货 为 例 对 实验 结果 的 详 
基于 前 两 节 的 分 析 过 程 ， 利 用 黄金 和 大 豆 期 货 的 价格 数据 对 本 文 提 出 的 系统 


进行 更 多 的 实验 。 


报告 的 评价 指标 包 


5.1. 机 器 学 习 分 类 器 的 预测 性 能 表现 


每 个 模型 的 平均 准确 率 和 Fl1 值 是 由 27 个 测试 集 的 评估 分 数 
察 其 标准 差 ， 详 细 结 果 如 表 4 所 示 。 合 所 有 时 期 的 结果 


在 所 有 分 类 器 中 表现 最 好 ， 准 表 


分 析 ， 而 章节 3$.3 是 


得 出 的 ， 同 时 也 观 
， 逻 辑 回 归 分 类 器 


角 率 值 为 532.952.9%， 然 而 El1-Score 是 最 低 的 ， 


只 有 43.1%， 这 说 明 LR 分 类 器 只 能 在 某 些 时 期 表现 特别 好 ， 但 不 稳定 。 除 了 
平均 ACC 分 数 最 低 的 KNN 分 类 器 和 LR 分 类 器 ， 其 他 四 个 分 类 器 的 表现 相对 


均衡 ， 可 以 作为 候选 分 类 器 。 


这 是 一 个 可 观 的 效果 。 


综合 所 有 分 类 器 ， 他 们 的 准确 率 都 在 50% 以 上 ， 


考虑 到 不 同时 间 段 的 金融 市 场 总 是 受到 国家 经 济 政 策 


及 其 他 宏观 或 微观 的 影响 ， 分 别 观察 27 个 时 间 段 的 预测 结果 更 为 合理 ， 如 图 


9 所 示 。 


对 于 准确 率 来 说 ， 除 了 预测 时 间 在 2019 年 9 月 1 日 的 准确 率 只 有 0.40， 绒 
它 大 部 分 时 间 内 ， 分 类 器 准确 率 基 本 可 以 达到 0.530 以 上 。 表 现 最 好 的 两 个 时 
习 ， 分 类 器 准确 率 高 达 0.60 及 


间 段 是 2020 年 9 月 和 2021 年 1 


、 地 缘 政 治 事件 以 


以 上 。 二 中 ， 表现 
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表 4. 螺纹 钢 期 货 数据 在 逻辑 回归 (LR), jc 


近邻 KNN), 朴素 贝 叶 斯 NBO)， 


XGBoost(XGB), CatBoost(CATB) 和 LightGBM(LGBMD) 分 类 器 的 评估 分 数 


Classifier LR KNN NBC 


XGB CAIB LGBM 


ACC 0.529 士 .058 ”0.501 士 .021 ”0.520 士 .042 
Fl-Score ”0.431 士 .0601 “0.493 士 .017 ”0.462 士 .042 


0.518 士 .025 ”0.519 士 .042 ”0.518 士 .044 
0.493 士 .014 ”0.471 士 .032 ”0.466 士 .032 


一 logistic 


| 一 mn 
-一 吓 050 ] 
0.60 ] 一 一 芭 boost 
~ 一 lightgbm 
055] -一 Gatboost 0.45 


-一 logistic 


] 一 lightgbm 


~ 一 mn 
下 
一 旭 boost 


一 Gatboost 


图 9%. 每 个 时 间 段 的 机 器 学 习 模 型 的 准确 率 和 F1 分 数 〈 螺 纹 钢 期 货 ) 


最 好 的 是 逻辑 回归 分 类 器 ， 其 ACC 值 大 于 0 


.65。 但 由 于 逻辑 回归 分 类 器 在 所 
有 时 间 段 中 处 于 峰值 也 处 于 低谷 ， 所 以 表现 并 不 稳定 。 而 KNN 的 整体 分 数 


都 较 低 ， 所 以 在 选取 最 终 使 用 的 分 类 器 方面 考虑 首先 排除 这 两 项 。 除 了 参 
考 准确 率 以 外 ， 分 类 模型 通常 使 用 F1 分 数 作为 模型 评估 标准 之 一 。F1 分 数 


是 精确 率 和 召回 率 的 调和 平均 数 。 在 图 9 中 可 以 总 结 出 整体 F1 分 数 在 0.50 左 
右 ， 而 逻辑 回归 和 朴素 贝 叶 斯 分 类 器 的 表现 异常 ， 且 在 多 个 时 间 段 中 分 数 只 


达到 0.3$。 反 而 在 Fl 评估 指标 中 KNN 分 类 器 和 XGBoost 分 类 器 表现 比较 稳定 ， 
均 在 0.4$ 至 0.50 之 间 浮 动 。 结 合 ACC 和 Fl1-Score 的 平均 值 以 及 分 时 段 的 评估 结 


果 ，CatBoost 和 XGBoost 分 类 器 的 表现 更 佳 。 


5.2. 基于 机 器 学 习 分 类 器 的 交易 系统 绩效 评 


估 


除了 需要 参考 模型 评估 分 数 之 外 ， 还 需要 考虑 胜率 和 净利 润 作为 模型 性 能 的 


评估 标准 。 如 表 5 所 示 ， 没 有 过 滤 的 历史 回 


测 ， 即 只 使 用 唐 奇 安 通道 交易 策 


略 所 产生 的 胜率 为 40.58% 〈 和 包含 0.03 驳 的 交易 费用 )， 利 润 仅 为 9216.23 元 。 使 


用 了 机 器 学 习 框架 作为 过 滤器 后 ， 除 KNN 模 型 过 滤器 的 胜率 和 净利 润 不 升 反 
降 外 ， 其 他 五 个 过 滤器 构建 的 策略 均 在 胜率 上 有 提升 ， 有 具体 体现 在 盈利 能 力 


上 ， 平 均 净 利润 涨幅 达 103.13%。 其 中 ，XGBoost 过 滤器 产生 了 最 高 的 胜率 和 
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愉 利 ， 净 利润 达到 200.29 驳 的 涨 
产生 了 较 大 改变 ， 所 以 XGBoost 模型 也 达到 在 整体 市 场 价格 走势 


的 


目的 。 


. 唐 奇 安 交 易 策略 和 基于 不 同 分 类 器 的 


分 类 器 ”胜率 (%) ”净利 润 RMB) 
无 过 滤 40.58 9,216.23 
LR 44.29 18,606.37 
KNN 40.21 7,148.43 
NB 43.48 6,948.39 
XGB 44.64 27,675.19 
CATB 41.57 4,776.60 
LGBM 42.19 5,596.11 


囊 。 整 体 而 言 ， 朋 


赴 奇 安 交 易 策略 的 胜率 和 净利 润 〈 螺 纹 钢 期 货 ) 


E 率 有 所 提升 的 同时 熏 利 也 
稳定 多 利 


选择 出 基于 XGBoost 过 滤器 的 唐 奇 安 通 道 交 易 策 略 作为 螺纹 钢 合约 的 最 


优 中 长 期 预 讽 


如 表 6， 


源 。 


| 模型 后 ， 根 据 回 
收益 率 增 长 达 60.19%， 
型 显著 地 提高 了 投资 的 


测报 告 可 计算 


汉 


片 


| 


报 率 


》 


同时 ， 最 大 资产 回 撤 的 回 


以 使 唐 奇 安 交 易 系 统 有 较 好 的 收益 稳定 公 


撤 


的 策略 绩效 评 


上 更 多 指标 评估 模型 效果 。 
FE 化 收益 率 由 6.39% 提 升 到 1 


已 苇 ze 
日 可 投资 


表 6. 基于 XGBoost 过 滤器 的 策 个 结果 〈 螺 纹 钢 期 货 ) 


具体 


5$.68%， 说 明 该 模 
可 在 资产 分 配 中 投入 更 多 的 资 
幅度 降低 了 63.85%， 表 明 XGBoost 过 滤器 可 
E 和 抗 风 险 能 


可 测 指标 无 过 滤 ”基于 XGB 的 交易 系统 
胜率 40.589% 44.649% 
净利 泣 9,216.23 27,675.19 
收益 率 32.039% 92.229%2 
年 化 收益 率 6.399%6 15.68% 
最 大 资产 回 撤 (RMB) 9,361.25 3,383.97 
净利 润 /最 大 资产 回 撤 1.03 8.18 
从 2018 年 1 月 到 2022 年 6 月 的 回 测报 告 中 绘制 的 资产 曲线 如 图 10 所 示 。 红 
色 曲 线 是 使 用 XGBoost 分 类 器 过 滤 后 的 策略 ， 曲 线 显示 出 稳定 上 升 的 趋势 。 


周期 


FE2020 年 6 月 和 2021 年 6 月 之 间 ， 蓝 色 


kt 跃 ， 这 对 于 
线 是 前 两 者 的 价差 序列 ， 这 表示 在 盈利 能 力 方 
面 ， 有 XGBoost 的 交易 系统 与 没有 XGBoost 的 交易 系统 有 较 大 的 差距 。 


希望 长 期 有 稳定 回 


蓝 色 曲 线 是 没有 过 滤 的 策略 ， 呈 现 一 个 缓慢 地 逐步 上 升 的 趋势 ， 虽 然 在 回 测 
内 也 是 公 利 的 但 并 不 持续 。 特 别 是 如 
昌 线 显示 了 一 个 低谷 ， 然 后 是 一 个 大 的 昂 
投资 者 来 说 是 不 利 的 。 绿 色 曲 


报 的 


结合 
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图 表 和 回 测 指标 可 以 得 出 结 
同时 也 表现 出 了 出 色 的 抗 风 险 能 力 。 


RMB (Unit THOUS) 


VS 


5841 
539 
518 
497 
47.6 
456 
435 
是 | 44 
吼 | 393 
372 
351 
330 二 
31.0 Tu 。 4 
289 从 wy wy AN 
SR 
247 


论 ， 使 用 XGBoost 过 滤器 的 策略 更 加 稳定 和 高 效 ， 


Asset of Donchian channel 
based on XGBoost system 


in" 


1 
人 R 


Asset of 
必 Donchian channel 
system 


Spread 
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图 10. 基于 XGBoost 的 


赴 奇 安 通道 交易 系统 的 资 


.3. 黄金 和 豆粕 期 货 的 实证 分 析 


以 螺纹 钢 期 货 为 例 ， 从 章节 5.1 和 章节 5.2 中 可 知 
模型 后 将 选 定 的 模型 整合 到 技术 分 析 策 略 中 进行 
分 析 过 程 来 分 析 黄 金 和 豆粕 期 货 的 实验 结 
表 7. 黄金 和 


[豆粕 期 货 数据 在 罗 辑 回归 (LR), k- 近 邻 KNN), 朴素 贝 叶 # 


线 《〈 螺 纹 钢 期 货 ) 


， 选 择 表现 最 好 的 机 器 学 习 
回 测 。 同 样 地 ， 使 用 同样 的 


折 INBO)， 


XGBoost(XGB), CatBoost(CATB) 和 LightGBM(LGBMD) 分 类 器 的 评估 分 数 


期 货 分 类 器 LR. KNN NB XGB CATB LGBM 
黄 全 ACC 0.526 士 .127 ”0.511 士 .067 ”0.530 士 .114 ，” 0.522 士 .080 ”0.523 士 .106 0.522 土 .095 
Fl1-Score ”0.435 土 .093 ”0.481 士 .048 ”0.457 土 .082 ”0.474 士 .052 ”0.454 士 .075 。” 0.461 士 .064 
豆 糙 ACC 0.494 士 .065 “0.494 士 .027 ”0.491 士 .042 ”0.492 士 .033 。” 0.488 士 .041 ”0.489 土 .039 
和 Fl1-Score “0.468 土 .053 ”0.488 土 .027 ”0.477 土 .037 。” 0.486 士 .031 ”0.479 土 .035 。 0.481 士 .035 
机 器 学 习 分 类 器 的 F1 值 和 准确 率 的 结果 见 表 7。 在 6 个 分 类 器 中 ， 在 黄金 
的 数据 上 进行 实验 的 表现 明显 好 于 豆粕 ， 每 个 分 类 器 的 27 个 测试 集 的 平均 精 


度 大 部 分 都 达到 了 52% 以 上 而 只 有 KNN 分 类 器 的 表现 稍 差 ， 这 与 螺纹 钢 期 货 
的 情况 相同 。 相 反 ，NB 模 型 的 结果 最 好 ， 准 确 率 达 到 53%。 从 Fl 衡量 标准 来 


二 


，KNN 是 最 好 的 而 NB 的 表现 并 不 十 分 突出 。 在 这 种 情况 下 ， 优 先 考虑 选择 
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准确 率 作为 标准 。 另 一 方面 ， 与 黄金 相 比 ， 所 有 分 类 器 对 豆粕 期 货 的 ACC3 
均值 来 说 表现 一 般 ， 但 整体 的 F1 分 数 却 比 黄金 的 好 。 其 中 ，KNN 的 两 个 评估 
结果 最 好 ， 准 确 率 和 F1 分 数 分 别 为 49.4% 和 48.8%。 因 此 ，KNN 分 类 器 被 选 为 
测 豆粕 期 货 的 唐 奇 安 交 易 系统 的 过 滤器 。 

尽管 对 比 每 个 分 类 器 应 用 到 策略 的 绩效 表现 是 合理 且 十 分 可 行 的 ， 但 考 
虑 到 实际 应 用 方面 ， 将 每 个 分 类 器 与 交易 策略 结合 起 来 再 进行 回 测 是 很 耗 时 
的 。 因 此 ， 我 们 直接 选择 模型 性 能 评估 中 表现 最 好 的 分 类 器 ， 然 后 把 这 个 过 
滤器 放 到 交易 策略 中 进行 回 测 。 实 验 中 使 用 过 滤器 前 后 的 黄金 和 豆粕 期 货 的 
绩效 表现 见 表 8 和 表 9. 
表 8. 基于 NB 过 滤器 的 策略 绩效 评估 结果 《黄金 期 货 ) 


以 


| 


期 货 可 测 指标 无 过 滤 基于 NB 的 交易 系统 
胜率 34.96% 36.539% 
净利 润 47,323.07 90,898.48 
收益 率 15.779% 30.309%5 
黄金 
年 化 收益 率 3.329% 6.089%6 
最 大 资产 回 撤 (RMB) ”96,417.34 54,918.63 
净利 润 /最 大 资产 回 撤 0.49 1.66 


表 9 基于 KNN 过 滤器 的 策略 绩效 评估 结果 《豆粕 期 货 ) 


期 货 可 测 指标 无 过 滤 基于 KNN 的 交易 系统 
胜率 35.459% 37.529%5 
净利 润 -11.264.40 -1.778.50 
收益 率 -3.75% -0.599% 
豆粕 人 
年 化 收益 率 -0.85% -0.139% 
最 大 资产 回 撤 RMB) 18,636.25 7.778.28 
净利 润 /最 大 资产 回 撤 -0.60 -0.23 


基于 NB 的 唐 奇 安 交 易 系 统 在 黄金 期 货 下 的 所 有 经 济 评价 指标 的 表现 都 超 
过 了 没有 过 滤器 的 系统 。 有 具体 来 说 ， 胜 率 提 高 了 1.57 多 ， 净 利润 从 47,323.07 元 
显著 地 提高 到 90,898.48 元 ， 这 意味 着 该 系统 在 回 测 期 间 鼻 利 的 概率 更 高 。 使 
用 过 滤器 后 ， 收 益 率 和 年 化 收益 率 几 乎 翻 了 一 番 。 最 大 资产 回 撤 从 96,417.34 元 
下 降 到 54,918.63 元 ， 这 表明 使 用 过 滤器 后 交易 可 能 产生 的 最 大 损失 减少 了 。 
由 于 净利 润 的 增加 和 最 大 资产 回 撤 的 减少 ， 两 者 之 间 的 比率 值 也 因此 有 所 增 
加 。 关 于 豆粕 期 货 ， 经 KNN 分 类 器 过 滤 后 的 唐 奇 安 交 易 系 统 在 所 有 评价 指标 
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上 也 有 所 提高 。 例 如 ， 朋 


E 率 从 原来 的 3$.45% 增 加 到 了 37.52% 。 值 得 关注 的 是 ， 


虽然 净利 润 是 负数 ， 这 意味 着 策略 会 造成 亏损 。 但 从 减少 损失 的 角度 来 看 ， 
月 KNN 过 滤器 后 净 亏 损 至 少 减少 了 6 倍 ， 这 也 反映 在 收益 和 年 化 收益 指标 


使 


站 5 


小 了 。 
上 述 实验 的 结果 可 以 简单 地 概括 道 ， 基 于 ML 过 滤器 视 为 策略 提高 了 中 


11 的 资产 
货 的 红色 


国 期 货 商 品 


场 三 个 代表 性 合约 的 愉 利 能 力 并 降低 了 可 
晶 线 展示 了 在 2018 年 1 月 至 2022 年 6 月 之 间 ， 使 / 


昌 线 高 于 蓝 色 曲线 。 这 说 明了 基于 NB 的 


Asset 


半 的 时 间 旦 
价差 曲线 呈现 稳定 的 上 升 趋 
这 意味 着 基 了 
波动 大 有 


RMB (Unit THOUS) 


581 


53.9 


51.8 


497 


476 


SA 


势 ， 乡 


都 取得 了 良好 的 收益 。 在 豆粕 期 货 数据 的 测试 中 ， 如 
[ 蓝 曲线 之 间 的 距离 从 2018 年 10 月 开始 拉 开 ， 
六 过 滤器 的 策略 可 以 使 资产 处 于 相对 稳定 的 状态 ， 尽 
传统 技术 指标 难以 获 利 的 时 期 。 


因此 ， 随 着 净 亏 损 的 减少 和 最 大 资产 回 撤 的 降低 ， 投 资 的 风险 也 从 而 变 


日 应 的 投资 风险 。 图 
jNB 过 滤器 后 黄金 期 
青 奇 安 交易 策略 在 这 四 年 


图 12 所 示 ， 
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图 11. 
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图 12. 基于 KNN 过 滤器 的 唐 奇 安 通 道 交 易 系 统 的 资产 曲线 〈 豆 粕 期 货 ) 


通过 以 上 利用 机 器 学 习 模型 结合 唐 奇 
趋势 的 预测 ， 得 出 以 下 结论 : (1) 通过 对 比 LR、KNN、NBC、XGBoost、 
CatBoost 和 LightGBM 分 类 模型 ，XGBoost 和 CatBoost 模 型 ， 在 处 表 
金融 时 间 序 列 问题 中 ，XGBoost 和 CatBoost 模 型 具有 较 好 的 预测 性 能 。 
下 奇 安 通道 交易 策略 中 提高 了 其 朋 
净利 润 ， 可 作为 有 效 过 滤 条 件 使 用 在 趋势 跟踪 策略 中 ， 其 中 ， 


上 6 种 分 类 器 ， 除 KNN 模 型 外 ， 均 在 


是 XGBoost 模型 ， 结 合 其 预测 能 力 ， 


ee 
这 个 基于 机 器 学 习 的 唐 奇 安 交 易 系 统 的 怕 
滤 信 号 的 唐 奇 安 交 易 策略 在 菜 些 时 间 段 内 是 可 以 提 


06/28 


(2300) 


安 通道 交易 策略 对 螺纹 钢 价 格 涨 跌 


多 维度 的 


(2) 以 


E 率 和 
表现 最 突出 的 


抗 风 险 能 力 ， 熏 利 能 力 和 收益 稳定 性 均 
we， 类 器 中 展现 出 全 方位 的 优越 性 ， 可 以 认为 该 分 类 器 使 用 在 唐 奇 
道 交易 策略 中 作为 过 滤 条 件 用 以 预测 螺纹 钢 未 来 5 分 钟 K 线 涨 跌 趋 势 是 最 


能 ， 可 以 说 明 使 用 机 器 学 习 技 术 过 
高 策略 盘 利 能 力 和 降低 投 


资 风险 的 。 综 上 所 述 ， 可 供 选 择 的 机 器 学 习 预 测 器 和 技术 指标 的 灵活 的 组 合 


可 以 优化 传统 的 量化 交易 策略 。 


组 


提取 环节 中 的 输入 数据 的 维度 较 大 且 


型 的 运行 速度 产生 负面 影响 。 今 后 可 以 针对 特征 选择 和 降 品 处 理 的 方 


< 


图 


昌 然 将 机 器 学 习 模 型 引入 到 交易 策略 可 以 有 效 提 绩 效 表现 ， 但 由 于 特征 
其 中 可 能 存在 很 多 噪声 ， 这 可 能 会 


对 模 
进行 


进一步 研究 。 此 外 ， 在 今后 的 工作 中 使 用 更 多 的 策略 ， 进 一 步 提高 机 器 学 习 
模型 与 传统 策略 相 结合 的 可 行 性 。 且 由 于 中 国 的 期 货 市 场 结 构 与 其 他 
地 区 不 同 ， 未 来 可 以 在 其 他 商品 期 货 〈 如 S&P500 指 数 ) 中 测试 该 系统 的 性 


家 或 
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台 已 
月 5。 


另外 ， 关 于 深度 学 习 模 型 的 改进 ， 未 来 的 工作 中 会 考虑 对 LSTM 模 型 的 


参数 进行 优化 。 
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